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摘 要 : 太阳 故 斑 大 多 数 发 生 在 磁极 复杂 的 黑子 群 上 空 ， 因 此 黑子 群 磁 类 型 可 作为 巴 
测 太 阳光 斑 的 重要 依据 。 针 对 同时 具有 和 白光 图 和 磁 图 数据 的 太阳 黑子 分 类 , 提出 了 一 种 双流 
CNN 的 黑子 群 磁 类 型 分 类 方法 。 该 方法 通过 两 个 网 络 分支 同 时 提取 白光 图 和 磁 图 特征 ， 在 
全 连接 层 对 二 类 特征 进行 融合 , 最 后 用 于 训练 和 分 类 。 实 验 表明 该 方法 能 较 好 避免 单 通道 网 
络 模型 的 信息 损失 以 及 使 用 双 通 道 图 像 合 成 出 现 的 白光 图 和 磁 图 的 相互 影响 ， 加 权 FL 分 数 
可 达 84.87%， 平 均 准 确 率 可 达 84.93%。 

关键 字 : 太阳 黑子 ; 威尔逊 山 ; 双流 CNN: ResNet 
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太阳 泡 斑 "是 太阳 突然 释放 的 磁场 能 量 造 成 的 ， 长 期 观测 发 现 ， 大 多 数 兆 斑 发 生 在 黑子 

-> 群 的 上 空 ， 且 黑子 群 的 磁场 极 性 越 复 杂 ， 发 生 大 焰 斑 的 几率 越 高 。 因 此 黑子 群 的 磁 类 型 可 以 
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Lan 数学 形态 法 和 小 波 分 析 法 , 以 及 基于 数据 驱动 的 机 器 学 习 方 法 。 近 年 来 随 着 观测 条 件 的 进步 ， 

© 与 太阳 活动 有 关 的 数据 增长 迅速 ， 基 于 机 器 学 习 方 法 的 优势 越 来 越 显著 站。 

2008 年 Colak 等 采用 MclIntosh 分 类 方案 ， 提 出 了 一 种 混合 系统 ， 该 系统 使 用 从 SOHO / 
MDI 磁 图 图 像 中 提取 的 活动 区 域 数据 ， 对 SOHO / MDI 白 光 图 像 上 的 黑子 群 进行 自动 检测 。 

从 MDI 和 白光 图 像 中 检测 到 黑子 后 ， 使 用 MDI 磁 图 图 像 对 它们 进行 分 组 / 聚 类 。 通 过 集成 图 像 
处 理 和 神经 网 络 , 自动 对 检测 到 的 黑子 组 分 类 。 但 系统 存在 分 组 错误 和 小 型 黑子 漏 检 的 缺陷 。 

= 2010 年 Mehmmood A. Abd 等 5， 采用 改良 后 的 七 类 Zurich 分 类 方案 ， 使 用 SVM(Support 

全 Vector Machine, 支 持 向 量 机 ) 来 实现 对 太阳 全 日 面 白 光 图 像 上 黑子 群 的 自动 分 类 。 在 数据 预 处 

一 理 阶段 , 使 用 了 边缘 检测 、 品 声 去 除 以 及 二 值 化 来 分 割 黑子 群 和 日 面 , 之 后 对 黑子 群 的 进行 

yet 无 监督 分 割 , 将 属于 同一 组 的 黑子 进行 合并 ,然后 对 每 个 黑子 组 的 属性 提取 ,最 后 使 用 SVM 

来 进行 分 类 。 该 方法 精度 对 图 片 质量 和 失真 程度 有 所 要 求 ,， 且 分 割 过 程 对 结果 输出 的 速率 有 

= 较 大 影响 。 

O 2019 年 Yuanhui Fang 等 加， 使 用 CNN(Convolutional Neural Network， 卷 积 神经 网 络 ) 对 黑 

子 群 的 磁 类 型 进行 分 类 , 在 数据 预 处 理 阶 段 图 像 被 分 为 三 类 ， 白光 图 、 磁 图 以 及 白光 图 和 磁 

图 的 合成 图 像 。 采 用 CNN 对 三 类 图 像 进 行 分 类 ， 结 果 显 示 单 独 使 用 白光 图 的 分 类 效果 最 佳 。 

该 方法 作者 认为 磁 图 结构 相对 白光 较为 复杂 ， 使 用 CNN 不 能 很 好 地 提取 特征 ， 是 造成 使 用 

磁 图 分 类 不 佳 的 主要 原因 之 一 。 

双流 CNN 可 以 融合 对 象 不 同 维度 的 特征 ， 为 分 类 任务 提供 更 多 的 特征 信息 。 在 动作 识 

别 领域 ， 双 流 CNN 一 个 分 文 用 于 提取 RGB 图 的 空间 信息 ， 另 一 个 分 文 用 于 提取 光 流 图 的 时 

闻 信 息 ， 融 合 之 后 进行 动作 识别 。 采 用 该 方法 识别 打斗 行为 ， 平 均 识 别 率 可 达到 89.3%， 高 

于 单一 分 支 情况 门 。 

Mount Wilson 方 案 判断 黑子 群 磁 类 型 需 用 到 不 同 维度 的 特征 信息 , 首先 通过 白光 图 观察 
黑子 群 结构 ， 然 后 查看 对 应 磁 图 的 磁极 分 布 ， 最 后 将 二 者 结合 起 来 确定 黑子 群 的 磁 类 型 。 鉴 

于 Mount Wilson 方 案 的 特点 ， 本 文 将 双流 CNN 用 于 对 黑子 群 磁 类 型 分 类 , 一 个 分 支 用 于 提取 

白光 图 特征 ， 男 一 个 分 支 用 于 提取 磁 图 特征 , 不 同类 型 的 特征 在 全 连接 层 前 进行 融合 。 分 类 
结果 显示 ， 双 流 CNN 对 黑子 群 磁 类 型 的 分 类 准确 率 高 于 用 CNN 对 单一 白光 图 或 磁 图 进行 的 
分 类 。 本 文 内 容 安排 如 下 : 第 1 节 介 绍 数据 集 与 预 处 理 ， 第 2 节 介绍 实验 方案 ， 第 3 节 是 实验 
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结果 与 分 析 ;， 第 4 节 是 本 文 结论 。 
1 ”数据 集 与 预 处 理 


本 文 使 用 的 数据 集 为 SOLAR-STORM1 中 ， 它 由 空间 环境 人 工 智能 预警 创新 工 坊 整理 提 
供 , 可 在 天 池 实 验 室 (https://tianchi.aliyun.com/dataset/) 公 开 下 载 。 该 数据 集 基 于 Mount Wilson 
黑子 群 磁 类 型 分 类 方案 , 分 为 白光 图 和 磁 图 两 部 分 ， 由 于 同一 时 刻 的 同一 观测 对 象 有 白光 图 
和 磁 图 两 类 图 像 , 所 以 二 者 是 一 一 对 应 的 , 每 个 白光 图 部 分 或 磁 图 部 分 含 Alpha、Beta、Betax 
三 个 类 型 。 

我 们 将 Alpha、Beta、Betax 中 6205 号 、6207 号 、6206 号 之 后 的 划 归 至 测试 集 ， 其 余 作 训 
练 集 使 用 ， 有 具体 分 布 情况 如 表 1 所 示 。 

表 1 数据 集 分 布 情况 


Tab.1 Data set distribution 


Alpha Beta Betax Sum 
Trainset 4709 7353 2407 14469 
Testset 567 496 109 1172 
Sum 5276 7849 2516 15641 


原始 数据 集 是 FIT 格 式 ， 其 中 白光 图 像素 值 范围 为 [200,74000], 磁 图 像素 值 范 围 为 
[-5000,5000], 我 们 将 白光 图 值 域 压缩 至 [0,255] 转 为 JPG 格 式 ， 将 磁 图 [-800,800] 范 围 内 的 压缩 
至 [0,255] 以 加 强 其 特征 。 图 1 分 别 为 Alpha、Beta、Betax 的 白光 图 和 磁 图 。 可 以 看 出 Alpha 类 
为 单 极 黑子 群 ，Beta 类 极 性 相反 双 极 黑子 群 ，Betax 类 为 复杂 的 多 极 黑 子 群 。 


e o 


(a)Alpha 白光 图 (b)Beta 白光 图 


(d)Alpha 磁 图 (e)Beta 磁 图 (f)Betax 磁 图 


图 1 Alpha, Beta, Betax 的 白光 图 和 磁 图 


Fig.1 Continuum and magnetogram of Alpha, Beta and Betax 
由 于 太阳 黑子 拍摄 时 间 间 隔 为 96 分 钟 ， 短 时 间 内 黑子 群 演化 并 不 明显 ， 导 致 一 定时 间 
段 肉 ， 观 测 对 象 的 照片 之 间 相 似 度 很 高 。 如 图 2，Beta 类 中 26 号 对 象 在 一 天 内 不 同时 刻 所 拍 
摄 的 白光 图 和 磁 图 几乎 看 不 出 变化 。 
为 避免 数据 切 分 时 训练 集 和 验证 集 有 相似 图 像 造成 准确 率 虚 高 ， 我 们 将 数据 按 对 象 进 
行 子 类 归 集 ， 之 后 按 对 象 划分 训练 集 和 验证 集 并 以 十 折 交 叉 验 证 方式 训练 和 测试 。 
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(a)2010 年 5 月 22 号 0 点 0 分 白光 图 (b) 2010 年 5 月 22 号 1 点 36 分 白光 图 


(c) 2010 年 5 月 22 号 0 点 0 分 磁 图 (d) 2010 年 5 月 22 号 1 点 36 分 磁 图 


图 2 26 号 对 象 不 同时 刻 的 白光 图 与 磁 图 


Fig.2 Continuum and magnetogram of object 26 at different times 


2 ”实验 方案 


2.1 双流 CNN 分 类 方法 

首先 建立 两 条 不 同 的 CNN 网 络 ， 以 ResNet50b 错 误 ! 未 找到 引用 源 。(Residual Network, 
残 差 网 络 ) 为 Backbone， 接 着 将 白光 图 和 磁 图 分 别 输入 ， 由 于 图 像 进入 的 是 不 同 的 分 支 ， 所 
以 CNN 的 权重 不 存在 共享 。 两 类 图 经 过 网 络 提 取 特 征 后 形成 特征 向 量 ， 然 后 将 特征 向 量 进 
行 拼接 ， 之 后 进入 全 连接 层 ， 以 Softmax 进行 分 类 ， 采 用 的 网 络 结构 如 图 3 Aras. 


Concatenate 


ResNet50 


Fig.3 Structure diagram of dual-stream CNN 


图 3 采用 的 双流 CNN 结构 


2.1.1 ResNet50 

ResNet 是 Kaiming He 等 为 解决 深层 网 络 的 退化 现象 提出 的 ， 其 基本 思想 是 在 ResNet 
单元 内 设置 跳跃 链接 ， 这 样 原始 信息 能 够 直接 传递 至 后 面 的 层 。 常 见 的 ResNet 网 络 层 数 有 
18,34,50 和 101 等 。 ResNet 基本 结构 如 图 4(a), 其 中 x 为 输入 , f(x) 为 映射 函数 ，H(x) 为 输出 。 
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H(x)=f(x)+x H(x)=f(x) 
(a) (b) 


图 4 ResNet 模块 和 CNN 模块 


Fig.4 ResNet module and CNN module 
由 ResNet 模块 可 知 f(x)=H(x)-x, 即 ResNet 模块 学 习 的 是 输入 和 输出 之 间 的 差 值 . 当 网 络 
到 达 某 层 为 最 优 状 态 时 ，CNN 需要 进一步 更 新 权重 ， 而 ResNet 模块 只 需 做 恒 等 映 射 ， 继 而 
避免 了 网 络 退 化 的 发 生 。 
2.1.2 防止 过 拟 合 的 措施 


= 为 避免 模型 过 拟 合 ， 实 验 中 进行 了 数据 增强 ， 添 加 了 Dropout, L2 和 Label smoothing 
= 三 种 正则 化 方法 。 
一 数据 增强 使 用 旋转 、 水 平 镜像 、 放 缩 来 丰富 数据 分 布 ， 以 提高 模型 泛 化 能 
= Dropout 值 设 为 0.5， 即 随机 设 定 特征 向 量 中 一 半 为 0， 其 本 质 是 在 该 层 引入 噪声 ， 以 避 
© 免 因 为 某 些 不 显著 的 偶然 性 获得 正确 的 结果 。 
o L2 正则 化 可 强制 使 权重 参数 取 较 小 的 值 以 防止 过 拟 合 ， 实 现 方法 是 在 损失 函数 中 添加 
© 权重 系数 的 平方 。 使 用 的 交叉 箭 损失 函数 公式 如 下 : 
N n-l 
= Loss = -}'q,log(p;) wy 
i=0 
其 中 为 样本 总 量 ，i 为 类 别 序数 ，g 为 样本 实际 标签 ，p 为 样本 预测 标签 。 
添加 LL2 正则 化 后 : 
n- A 
Loss = -> q;log(p;) + P yw (2) 
i=0 w 


其 中 4 为 正则 化 参数 ， 设 为 0.001，w 为 权重 。 
由 公式 (2) 可 知 ， 如 果 权 重 值 变 大 ，Loss 值 就 会 增 大 ， 所 以 为 了 降低 Loss 值 模型 会 逐步 
调 低 w 的 值 ， 这 样 即使 输入 值 差 异 很 大 ， 模 型 的 预测 变化 也 不 会 很 大 。 
Label smoothing 是 对 公式 (1) 的 q 做 调整 , 当 样 本 标签 转换 为 One-hot 形式 后 , 真 值 为 1， 
其 他 为 0， 而 由 Softmax 计算 得 来 的 疡 在 训练 过 程 中 需 逐 步 逼 近 gq, Softmax 计算 公式 如 下 : 


S= To (3) 
il 


其 中 i 为 类 别 序数 ，j 为 类 别 总 数 。 

通过 公式 (3) 的 计算 ， 模 型 的 输出 变 为 了 概率 分 布 ， 再 结合 公式 (2) 可 知 ， 由 于 样本 标签 
非 0 即 1 的 表示 ,会 使 得 分 类 正确 时 的 Loss 值 趋 近 0， 分 类 错误 时 的 Loss 值 趋 近 -c<e ， 而 这 
种 激励 惩罚 机 制 过 于 极端 , 只 适用 于 数据 集 能 够 覆盖 所 有 可 能 性 或 数据 集 标注 完全 正确 的 情 
况 ， 为 缓和 这 种 极端 的 激励 惩罚 机 制 ， 对 标签 的 One-hot 形式 做 以 下 改动 : 
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l-e k=y 
di = (4) 
Ekn-l) ky 


其 中 2 为 设置 的 超 参数 ， 设 为 0.1, 大 为 类 别 标签 ，y 为 样本 真实 标签 。 

由 公式 (4) 可 知 ， 由 于 拉 近 了 类 间距 离 ， 减 少 类 内 距离 ， 使 得 模型 的 泛 化 能 力 得 以 进 一 
步 提 高 。 
2. 2 实验 对 比 组 方法 

为 形成 实验 对 比 ， 另 设 ResNet50 和 文献 [6] 使 用 的 CNN 模型 ， 所 有 模型 除 网 络 结构 外 
数据 划分 、 超 参数 、 防 过 拟 合 措 施 等 均 采 用 相同 配置 ， 采 用 的 CNN 模型 结构 如 图 5 所 示 。 
该 结构 具有 三 个 卷 积 层 ， 卷 积 核 尺 寸 均 为 (5,5) ， 每 一 层 的 卷 积 核 数量 均 为 上 一 层 的 两 倍 ， 
以 达到 提取 图 像 特征 的 目的 ， 特 征 提取 后 形成 特征 向 量 输 入 全 连接 层 ， 随 后 以 Softmax 分 类 
器 进行 分 类 。 输 入 层 方 面 ,将 白光 图 、 磁 图 、 白 光 图 和 磁 图 构成 的 双 通 道 图 片 分 别 输入 到 网 
络 中 ， 进 行 训练 ， 最 终 获 得 7 组 数据 。 


Maxpooling2D Maxpooling2D 


Maxpooling2D 


图 5 对 比 组 采用 的 CNN 结构 区 


Fig.5 CNN structure diagram used by the comparison group 
2.3 模型 评价 指标 
本 实验 以 各 模型 的 准确 率 (Accuracy) 、 精 确 率 (Precision) 、 召 回 率 (Recall) 、F1-score 
CFI 分数) 、 混 涌 和 矩阵 来 评估 模型 的 分 类 性 能 。 以 Alpha 为 例 上 述 指标 计算 公式 如 下 : 


TA+TB+TX 
Accuracy = (5) 
TA+TB+TX+AB+AX+BA+BX+XA+XB 
bas TA 
Precision = (6) 
TA+BA+XA 
TA 
Recall = (7) 
TA+AB+AX 
2TA 
Fl-score = (8) 
2TA+AB+AX+BA+BX 


三 类 别 的 混淆 矩阵 如 表 2 所 示 ， 其 中 TA 是 正确 将 Alpha 类 识别 为 Alpha %, TB 是 正 
确 将 Beta 类 识别 为 Beta 类 ，TX 是 正确 将 Betax 类 识别 为 Betax 类 ，AB 是 错误 将 Alpha 类 
识别 为 Beta 类 ，AX 是 错误 将 Alpha 类 识别 为 Betax 类 ，BA 是 错误 将 Beta 类 识别 为 Alpha 
类 ，BX 是 错误 将 Beta 类 识别 为 Betax 类 ，XA 是 错误 将 Betax 类 识别 为 Alpha 类 ，XB 是 错 
误 将 Betax 类 识别 为 Beta 类 。 


#2 三 种 类 别 的 混淆 矩阵 


Tab.2 Confusion matrix of three classes 


预测 为 Alpha 预测 为 Beta 预测 为 Betax 
实际 为 Alpha TA AB AX 
实际 为 Beta BA TB BX 
实际 为 Betax XA XB TX 
3 ”实验 结果 与 分 析 
由 于 实验 采用 十 折 交 叉 验 证 ， 实 验 中 用 StratifiedKFold 对 训练 集 切 分 为 10 份 ， 每 次 选 


1 份 作 验 证 集 , 其 余 作 训 练 集 , 最 后 统计 模型 在 测试 集 上 的 分 类 情况 。 评 价 指标 取 加 权 均 值 ， 


TVA FE 


阵 按 模型 对 应 的 混淆 矩阵 的 和 来 计算 。 实 验 数 


表 3 各 模型 实验 结果 


EUX 3 所 示 : 


Tab.3 Experimental results of each model 


Weighted Weighted Weighted 
Model Data Average accuracy 
Precision Recall Fl-score 
模型 数据 源 平均 准确 率 
加 权 精 确 率 加 权 召 回 率 加 权 Fl 分数 
CNN HE 75.00% 76.58% 75.00% 75.28% 
CNN 磁 医 74.69% 16.96% 74.69% 74.68% 
光 图 + 磁 图 的 
CNN 75.38% 16.53% 74.82% 75.07% 
双 通 道 
ResNet50 光 图 81.48% 82.96% 81.48% 81.69% 
ResNet50 AE 83.98% 84.63% 83.98% 84.09% 
光 图 + 磁 图 的 
ResNet50 83.09% 83.89% 83.09% 83.04% 
双 通 道 
双流 
光 图 + 人 磁 图 84.93% 85.27% 84.93% 84.87% 
ResNet50 
从 表 3 可 以 看 出 ,双流 ResNet50 的 各 项 指标 都 是 最 高 ,即使 有 映射 寻 优 能 力 的 ResNet50， 
在 缺失 部 分 数据 的 情况 下 也 不 及 双流 ResNet50， 这 表明 在 面 对 同 一 测试 集 的 情况 下 ， 双 流 
ResNet50 有 更 好 的 分 类 能 力 。 


由 于 本 实验 测试 集 类 别 不 3 
参考 ， 通 过 对 比 相同 数据 源 、 不 同 模型 之 间 
有 较 大 提高 ， 当 数据 为 白光 
图 、 磁 图 


7.97%, 


这 种 深层 


能 的 原 


人 磁 图 结构 复杂 ， 所 以 当 
图 进入 CNN 后 ， 所 提取 的 特征 相 较 于 磁 


类 能 力 较 CNN 更 强 ， 
息 ， 


类 的 信 


少 。 


当 数 据 为 白光 


Li 


PA AE AES 


图 、 磁 图 、 双 通道 
、 双 通道 图 
提取 能 力 比 CNN 这 种 浅 层 网 络 要 强 ， 


白光 


Heh 


所 以 当 


M7, 


白光 


人 磁 


图 进入 ResNet50 Ja, H 


图 最 


ay 


6 图 和 磁 图 


FE 衡 , 模型 指标 以 加 权 Fl1-score 为 主要 参考 ， 
的 实验 结果 可 知 ResNet50 的 F1 分 数 相 比 CNN 
图 时 ， 加 权 Fl-score 提高 了 6.41%, 9.41%, 
时 提高 了 6.48%、9.29%、7.71%， 这 表明 ResNet50 


更 能 够 提 


显现 出 不 


取 到 有 
通过 对 比 相同 模型 、 不 同 数 据 源 之 间 的 实验 结果 可 知 当 模型 使 用 CNN 时 ， 使 用 
时 Fl 分 数 最 高 、 双 通道 图 次 之 、 磁 
最 高 、 双 通道 图 次 之 、 


氏 。 当 模型 使 用 ResNet50 时 ， 使 用 磁 图 


图 最 低 。 在 不 同 模型 下 白 》 


其 他 指标 为 辅助 


的 特征 。 
白光 图 
时 Fl 分 数 
同 的 分 类 优势 ， 可 


有 | 


因 是 CNN 架构 简单 ,深度 较 浅 ，ResNet50 架构 复杂 ,深度 较 深 , 而 白光 图 
图 进入 CNN 后 ， 不 能 被 CNN 提取 到 有 利于 分 类 的 特征 ， 


结构 简单 、 
当日 光 


图 


Ege 


J ANH 


的 提取 的 特征 对 分 类 更 有 利 。 而 ResNet50 
图 进入 ResNet50 后 ， 其 复杂 的 结构 得 以 提供 更 多 有 利于 
构 简 单 ， 提 供给 分 类 的 信息 相对 于 磁 


的 分 


分 


图 较 
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由 于 ResNet50 分 类 较 强 ,再 比较 ResNet50 和 双流 ResNet50 的 实验 结果 ， 由 结果 可 知 ， 
使 用 双 通 道 图 的 模型 的 分 类 能 力 相 比 使 用 磁 图 模型 有 所 下 降 , 这 说 明白 光 图 和 磁 图 形成 的 双 
通道 图 输入 进 模型 后 ， 互 相 之 间 有 影响 ， 该 影响 对 形成 分 类 所 需 的 特征 向 量 有 负面 作用 。 最 
后 以 使 用 磁 图 的 ResNet50 为 基线 , 对 比 双 通道 图 的 ResNet50 和 双流 ResNet50 的 实验 结果 ， 
可 以 发 现 两 者 都 有 白光 图 的 加 入 ， 但 使 用 双 通 道 图 的 模型 F1 分 数 下 降 ， 双 流 ResNet50 的 
Fl 分 数 上 升 , 这 说 明 双 流 ResNet50 在 数据 的 总 和 使 用 和 数据 特征 提取 方面 相对 其 他 模型 更 
有 优势 。 

据 文献 [6] 结 果 可 知 ,模型 使 用 白光 图 、 磁 图 、 双 通道 图 的 Fl 分 数 分 别 为 94.20%、87.22%、 
88.61%， 结 果 均 优 于 双流 ResNet50， 造 成 该 情况 的 可 能 原因 如 下 : 1、 数 据 质量 有 差异 ， 文 
献 [6] 采 用 数据 集 是 在 太阳 盘 中 心 士 75 度 的 经 度 以 内 且 背 景 噪声 较 小 的 黑子 群 图 像 ， 而 
SOLAR-STORMI1 数据 集中 存在 部 分 临 边 的 黑子 群 和 噪声 大 的 图 像 ，2、 数 据 集 的 切 分 方式 
不 同 ， 文 献 [6] 采 用 随机 切 分 方式 ， 同 一 黑子 群 在 短 时 间 内 演化 不 明显 时 ， 这 可 能 导致 训练 
集 和 测试 集中 存在 相似 度 较 高 的 图 像 。 本 文 按 照 黑子 群 对 象 切 分 , 同一 黑子 群 的 图 像 不 会 在 
训练 集 和 测试 集 同时 出 现 ，3、 训 练 方式 不 同 ， 文 献 [6] 对 数据 集 做 一 次 切 分 ， 本 文采 用 十 折 
交叉 验证 ， 计 算 平均 值 。 


表 4 双流 ResNet50 的 混淆 和 矩阵 
Tab.4 Confusion matrix of dual-stream resnet50 


预测 为 Alpha 预测 为 Beta 预测 为 Betax 
实际 为 Alpha 5092(89.8%) 575(10.1%) 3(0.1%) 
实际 为 Beta 639(12.9%) 4007(80.8%) 314(6.3%) 
实际 为 Betax 24(2.2%) 211(19.4%) 855(78.4%) 


从 表 4 可 以 看 出 ，Alpha 和 Betax 被 误 判 为 Beta 的 几率 较 高 ，Beta 被 误 判 为 Alpha 的 几 


率 相 比 被 误 判 为 Betax 的 几率 高 出 一 倍 。 

以 Alpha 类 7169 号 对 象 为 例 ， 如 图 6， 该 对 象 在 10 月 27 日 和 29 日 显示 为 一 个 单 极 黑 
子 群 ， 此 时 模型 分 类 正确 ， 而 在 28 日 黑子 群 右 上 方 ， 出 现 了 另 一 个 黑子 ， 该 黑子 特征 被 模 
型 提取 后 ， 致 使 整 张 图 片 分 类 为 Beta。 所 以 演化 过 程 中 短暂 性 出 现 的 黑子 可 能 是 模型 误 判 
的 原因 之 一 。 


以 Beta 类 6242 号 对 象 为 例 ， 如 图 7。 初期 黑子 群 双 极 清晰 ， 但 在 演化 过 程 中 右 方 黑子 
逐渐 消散 ， 而 左 方 黑子 依旧 存在 ， 所 以 当 末 期 黑子 群 的 图 像 进入 模型 后 容易 被 判 为 Alpha, 


这 种 由 于 演化 形成 了 模糊 的 类 型 特征 可 能 是 模型 分 类 精度 不 佳 的 主要 原因 之 一 。 

另 以 Betax 类 6975 号 对 象 为 例 ， 如 图 8。 该 对 象 末期 逐渐 向 日 面 边缘 靠近 ， 由 于 投影 
效应 和 临 边 昏暗 效应 ， 导 致 了 黑子 群 白光 图 特征 模糊 ， 以 及 磁场 测量 的 精度 下 降 。 所 以 当 黑 
子 群 接近 日 面 边 缘 时 ， 图 片 质量 降低 可 能 也 是 模型 分 类 精度 不 佳 的 原因 。 


* * . 


(a)10 H 27 日 白光 图 (b)10 月 28 日 白光 图 (c)10 月 29 日 白光 图 
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(a)10 月 27 日 磁 图 (b)10 月 28 日 磁 图 
图 67169 号 对 象 于 2017 年 10 月 份 的 


白光 


(c)10 月 29 日 磁 图 


图 和 磁 图 


Fig.6 Continuum and magnetogram of object 7169 in October 2017 


(a)6242 号 对 象 初期 白光 图 


(c)6242 号 对 象 末期 白光 图 


图 7 6242 号 对 象 初期 和 末期 的 白 


光 图 


R 


(d)6242 号 对 象 末期 磁 


和 磁 图 


Fig.7 Continuum and magnetogram of the early and late stages of object 6242 


(a)6975 号 对 象 末期 白光 图 


(b)6975 号 对 象 末期 磁 图 


图 8 6975 号 对 象 末期 的 白光 图 和 磁 图 


Fig.8 Continuum and magnetogram of the late stages of object 6975 
SOLAR-STORM1 数据 集 为 FITS 格式 , 文件 为 7GB, 体 积 较 大 , 读 取 速度 较 慢 , 转 为 JPG 
格式 后 ， 文 件 为 600M， 读 取 速 度 较 快 ， 并 且 黑 子 群 的 特征 依旧 得 到 了 保留 ， 所 以 在 实验 中 


采用 转换 为 JPG 格式 的 数据 集 。 
4 结论 
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观测 条 件 的 进步 为 太阳 观测 提供 了 海量 数据 。 本 文 针 对 SOLAR-STORM1 数据 集 的 特 
点 ， 采 用 双流 CNN 方法 开展 黑子 群 磁 类 型 分 类 研究 ， 并 与 其 他 方法 进行 了 对 比 实验 。 实 验 
结果 表明 ， 双 流 CNN 对 黑子 群 磁 类 型 分 类 效果 更 好 ， 与 使 用 单 通道 的 方法 相 比 ， 双 流 CNN 
避免 了 仅 使 用 一 种 图 像 造成 的 数据 缺失 , 实现 了 数据 的 最 大 化 利用 , 与 使 用 双 通 道 的 方法 相 
比 双流 CNN 避免 了 图 像 特征 提取 过 程 中 , 白光 图 和 磁 图 的 互相 影响 ,在 相同 数据 源 情况 下 ， 


深层 模型 的 特征 提取 能 力 比 浅 层 模型 要 强 ; 在 算法 特征 提取 能 力 强 的 情况 下 , 仅 使 用 磁 图 比 
仅 使 用 白光 图 的 分 类 精度 要 高 ， 而 使 用 双 通 道 图 像 的 精度 介 于 两 者 之 间 。 

尽管 双流 CNN 表现 出 了 较 好 的 分 类 性 能 ， 但 由 于 部 分 对 象 在 演化 过 程 中 特征 逐渐 消散 
和 部 分 图 像 有 临 边 昏暗 现象 ， 使 得 双流 CNN 出 现 了 误 判 情况 。 接 下 来 的 工作 将 针对 这 两 方 
面 的 原因 对 双流 CNN 做 进一步 的 优化 。 
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A magnetic classification method of sunspot group 


based on dual-stream CNN 


Yang Wugu, Tian Weixin *, Zeng Shuguang, Huang Yao 

(School of computer and information, Three Gorges University, Yichang, Hubei 443000) 

Absrtact: Most solar flares occur over sunspot groups with complex magnetic polarities, so 
the magnetic type of sunspot groups can be used as an important basis for predicting solar flares. 
A sunspot group magnetic classification method, dual-stream CNN is proposed for sunspot 
classification with both continuum and magnetogram. The method simultaneously extracts the 
continuum and the magnetogram features through two network branches, then fuses the two types 
of features in the fully connected layer, and finally uses them for training and classification. 
Experimental results show that the method can avoid the information loss of single-channel 
network model and the interaction of continuum and magnetogram in the dual-channel image, and 
the weighted F1 score was 84.87%, and the average accuracy was 84.93%. 

Keywords: sunspot, Mount Wilson; dual-stream CNN; ResNet 
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